SEQUENCE LISTING 
SEQ ID N0:1 Scarlet Runner Bean G654 promoter 

-4242 GCATGCACTG CCACAAGTAG TGAACTCATG GTTTTACCTC CTCAAGTAGA 

-4192 AAACCTTTTG AGTGAATTTG AAGATTTATT CTCCCAAGAA GGACCCATTG 

5 -4142 GGCTTCCTCC TCTTAGGGGG ATAGAACATC AAATTGACTT TATACCGGGG 

-4 092 GCAAGCCTAC CAAATAGGCC TCCTTATAGA ACCAACCCCG AGGAAACAAA 

-4042 GGAGATAGAA TCACAAGTTC AAGACTTGTT GGAGAAGGGT TGGGTTCAAA 

-3 992 AGAGCCTAAG CCCTTGTGCT GTACCTGTCT TGTTGGTGCC AAAAAAAGAT 

-3942 GGAAAATGGC GTATGTGTTG TGATTGTAGA GCAATCAACA ACATCACCAT 

10 -3 892 CAAGTATAGG CATCCAATCC CAAGGCTTGA CGATATGCTT GATGAATTGC 

-3842 ATGGGTCAAC TCTATTCTCC AAAATTGACC TTAAAAGTGG ATATCACCAA 

-3 792 ATTCGAATCA AGGAGGGTGA TGAGTGGAAA ACCGCTTTTA AGACCAAATT 

-3742 TGGATTATAT GAGTGGTTGG TGATGCCCTT TGGTCTTACT AACGCTCCAA 

-3 692 GTACATTCAT GAGGCTTATG AATCACACCT TGAGGGATTG TATAGGTAAA 

15 -3642 TATGTAGTAG TTTATTTTGA TGATATCTTA GTATATAGTA AAACCCTAGA 

-3592 AGACCATCTA AGTCACCTTA GGGAAGTTCT TCTAGTTCTT AGGAAAAATA 

-3542 GTCTTTTTGC CAATAGGGAT AAGTGTACCT TTTGTGTAGA TAGCGTAGTC 

-34 92 TTTTTAGGCT TTATAGTAAA CCAAAAGGGG GTGCATGTAG ATCCCGAGAA 

-3442 AATCAAAGCC ATCCGCGAGT GGCCAACTCC ACAAAATGTA AGTGATGTGA 

20 -33 92 GAAGTTTTCA TGGGTTAGCT AGCTTCTATA GAAGGTTTGT TCCCAATTTT 

rj -3342 TCTAGCCTAG CTTCTCCCTT GAATGAACTT GTAAAAAAAG ATGTTGCATT 

"'I -32 92 TTGTTGGAAT GAAAAGCATG AGCAAGCCTT TCAAAGGCTA AAAGCTCACT 

-3242 CACCAATGCA CCCATCCTAT CTCTTCCAAA TTTTTCCAAA CTTTTGGAGA 

-3192 TAGAGTGTGA TGCATCGGGA GTAGGCATAG TGCGGTTTTG TTGCAAGGTG 

! |f5 -3142 GACACCCCTT GCTTATTTTA GTGAAAAACT CCATGGTGCC ACCCTCACTA 

: ;~ -3 092 CCCCACCTAT GACAAAGACT CTATGCTCTT GTGCGACCCT AAAGACTTGG 

^ -3042 GGAACACTAC CTTGnGTCCC AAAGAATTTG GnTATCCATA GTGATCACGA 

-2 992 GTCTTTAAAA TATTTAAAGG GCCAACACAA GCTCAATAAG AGACATGCTA 

: S| -2942 AATGGATGGA ATTTCTTGAA CAATTTCCTT ATGTCATCAA ATACAAGAAA 

=30 -2892 GGGAGCAC C A ATATAGTGGC CGATGCTCTT TCTAGACGGC ACACTCTCTT 

y : -2842 TTCAAAACTA GGTGCCCAAA TTCTTGGATT TGACCACATA AGAGAGCTTT 

L. -2792 ATCAAGAAGA TCAAGAACTC TCATCCATCT ATGCCCAATG TCTACATAGA 

-2742 GCACAAGGAG GTTACTATGT GTCCGAGGGA TATCTTTTTA AAGAAGGAAA 

| s !: -2 692 ACTTTGCATT CCCCAAGGAA CACATAGAAA ACTCCTTGTC AAAGAATCAC 

! {§5 -2642 ATGAAGGGGG ACTCATGGGC CATTTTGGAG TTGATAAAAC TCTAGACTTT 

^ -2592 TAAAAGCAAA ATTTTGTTGG CCACACATGA GGAAAGATGT CCACGACATT 

□ -2542 GTCTAGAGTA TCTCATGTTT AAAAGCAAAG TCTAGAACAA TGCCGCTGGA 

-24 92 CTCTACACCC CTTTGCCGAT TGCAAAGCTC CTTGTGAAGA CATTAGCATG 

-2442 GATTTCATTT TAGGACTTCC TAGGACTGCA AGAGGCCATG ACTCTATCTT 

40 -2392 TGTGGTAGTG GAC CGTTTTA GCAAAATGTC TCACTTTATT CCATGCCACA 

-2342 AAGTAGATGA TGCTCAAAAT ATTTCTAAAC TCTTCTTTAG AGAAGTGGTG 

-22 92 AGACTCCATG GTCTCCCTAG AAGTATAGTG TCCGATAGAG ATCACCTTAA 

-2242 ATATATAATT ATACACTTGT TTTTTTTCTC TTTTTTATTT TATCAAGTAA 

-2192 AAAGTATTTG TTCTAGATTA TTATGAGTAT ATACTTACTT TCTGTATTTC 

45 -2142 ATTTCTTTCT ATTTTTTATG ACGATGAAAT TTCTTATTAT ATCCAGACTT 

-2092 TTCATATATA TTTTTATTTC TTTTCCATCT AGATGCTCTG TACTTTTCTT 

-2042 CAGTTGAAAT TTCCACTCTC CAACAAAACA TCATTCAAGT TTTGTATAAC 

-1992 ACTGTGACGT TAACCAGTTA AAATAAGAAA ATCATGTAAT ATAAATTATT 

-1942 TCAGTAGATA TTTTAGAATT ACAAATACGA TAAATAATTA AATTTAAAAA 

50 -1892 ATTATTAAAC AATGAATTTT TTTGGAAATT AATATAAAAC TTAGACTTGT 

-1842 GGTTTCTTCA TTCAGTCAAA ACCTTTTTCT ATTGTGTGGC GTGTGCGTGA 

-1792 ACATCGAATT TGGGTGCTTT ATGCCGCTTT ATCTTCATCT GCACCTTCAA 

-1742 ATTAATAATT TAATTCCGGA AAATAATAAA CCCACACACT GTTT TATGC A 

- 16 92 ~TATATTAAGA TT^ATAAAACT AGMCTMT T^TA^GMTAT AAAATAATAAr 

55 -1642 ATGTAACAAA tgatgtcact aaagaagaaa aaaattaaca agaattgtaa 

-1592 TATATTTCTT TATGAAATGT TTTGTGCATT ACCGAGAGAG GTCGAACATG 

-1542 ATACACGCAA GCATCTAACT AGTTTGGTAA TTCCTTTTCA ACATCGnTAA 

-1492 GCACATCACA CTAAAATTAC TTTAAATAGA TAAATTAGAT TCAATTGGAT 

-144 2 GACATTAATT TATAATACTC TATCCAAAAT TATAACTATA AATAAAAAGT 
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-13 92 TATTTTTAGA AAATAAGTAA TGAAAATTTA ATTCTAAAAT TTATAACACT 

-1342 TTTATGCTGT GTTTGTTTCG AAGCATAGAA AAATAAAAAG TTATTGTTGG 

-12 92 GAATGAAAAG TGAAGAAAAT CATGTAATAA AAACAAAATG ACACGACAAT 

-1242 CAAAAAAAAA GTTTTCATGC AAAACTTTTT TCAAAATTTA CACTTTTATG 

5 -1192 ATGTGTTTGT TTCGAAGTGT AGAAAAACGA AAAGTTATTA TTGGTAATGA 

-1142 AAAGCGAAGA AAATCACGTA ATAAAAACAA AGCAAGATGG CACGACAATC 

-1092 AAAAAAAAGT TTCTACACAA AACTTTATTC AAAATTTACA ACACTTTTAT 

-1042 GTTGTTGTTT GTTTCCGAGG TATAGAAAAA CAAAGAATTA GTGTTGGTAA 

-992 TGAAAAGTGA AGAAAACCAT GTAATGAAAA CAAAATGGCA CGACAATCAA 

10 -942 AAAAAGTTTT CACGCAAAAT TTTCTTCAAA ATTTATAACA TTTTCATGTT 

-892 GTGTTTGTTT CAAAGCCTAG AAAAACGAAG AGTTACTATT GGTAATGAAA 

-842 AGCGAAGAAA ACCACATAAT AAAAACAAAA TGGCACGACA ATCAAGAAAA 

-792 AGTTTTCAGA CAAAACTTTT TTCAAAATTT ACTATGTTTA TTTCGAAATT 

-742 TAGAAAAACG AAGAGTTATT ATTAGTAATG AAAAGCGAAG AAAACTACGT 

15 -692 AATAAAAAAC AAAATGGCAC GACAATAAAA AAAGTTTTCA CGCAAAATTT 

-642 TCTTGGTGCG CAGAAAGTTA TATATATTAA TTAATTAATT TTCATTTACT 

-592 TTTTTCCCTT TTTATTTTAA AGTTAAATTA TTATTATTTT CATTTAAAAT 

-542 ATAAATATTA TTTAAATATA AAAAATATAA CCTTAATCAA AACAAAGCCT 

-492 TAATCTAAAA TTTACAACAC TTTTAACCTT AAAATTAACT TTAAAAGGAA 

20 -442 AATGATAGTG TGACAACTAA AAAAGTTGTA TACAACCCTG TCATAGGTTT 

-392 AGAAATAAAT ATATATAATA AAGAGTAAAT TTGTAATTAA ATGATATAAA 

-342 AAAGTATTAA AATAATAATA TTTAGAGTAG TAATATGGTT GTATAAAAAA 

□ -2 92 ATGTGGTTGT CCATATATCA TTATTCACTT TAAAATATCA TGACAAATAT 

□ -242 TTTCACCGAA AGATGGAAAG AACGAAAAGA GCGTTGGATA ATGGAAAAAT 
95 -192 ACAAGCAATC TCCCTCCAGT ACTTTGCATA ACATTTTGTA TTAGTGATGA 
fij -142 GTTTTTTATC ATATATATTT AGAATATAGG AAAATTTTAG AATCACGTGG 

^ -92 ATAGCTATAT AATAGTAATA TTTTAATTTA TAATGTAGTT GATTTTATTT 

fft -42 GTCAACTGGT ATACATAAAT ATGTGTTGAT AGTGGGTGAC TTGTGGCTTA 

i« 9 AAGAAATGTC CAGAGGCTGA CAACAACTCT GCACAGACTA GCGTAAAC 
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SEQ ED NO:2 Scarlet Runner Bean G654 genomic region 



-4242 GCATGCACTG CCACAAGTAG TGAACTCATG GTTTTACCTC CTCAAGTAGA 

j'iS -4192 AAACCTTTTG AGTGAATTTG AAGATTTATT CTCCCAAGAA GGACCCATTG 

-414 2 GGCTTCCTCC TCTTAGGGGG ATAGAACATC AAATTGACTT TATACCGGGG 

$5 -4092 GCAAGCCTAC CAAATAGGCC TCCTTATAGA ACCAACCCCG AGGAAACAAA 

^ -4042 GGAGATAGAA TCACAAGTTC AAGACTTGTT GGAGAAGGGT TGGGTTCAAA 

j i3 -3 992 AGAGCCTAAG CCCTTGTGCT GTACCTGTCT TGTTGGTGCC AAAAAAAGAT 

-3942 GGAAAATGGC GTATGTGTTG TGATTGTAGA GCAATCAACA ACATCACCAT 

-3 892 CAAGTATAGG CATCCAATCC CAAGGCTTGA CGATATGCTT GATGAATTGC 

40 -3842 ATGGGTCAAC TCTATTCTCC AAAATTGACC TTAAAAGTGG ATATCACCAA 

-3792 ATTCGAATCA AGGAGGGTGA TGAGTGGAAA ACCGCTTTTA AGACCAAATT 

-3742 TGGATTATAT GAGTGGTTGG TGATGCCCTT TGGTCTTACT AACGCTCCAA 

-3692 GTACATTCAT GAGGCTTATG AATCACACCT TGAGGGATTG TATAGGTAAA 

-3642 TATGTAGTAG TTTATTTTGA TGATATCTTA GTATATAGTA AAACCCTAGA 

45 -3592 AGACCATCTA AGTCACCTTA GGGAAGTTCT TCTAGTTCTT AGGAAAAATA 

-3542 GTCTTTTTGC CAATAGGGAT AAGTGTACCT TTTGTGTAGA TAGCGTAGTC 

-3492 TTTTTAGGCT TTATAGTAAA CCAAAAGGGG GTGCATGTAG ATCCCGAGAA 

-3442 AATCAAAGCC ATCCGCGAGT GGCCAACTCC ACAAAATGTA AGTGATGTGA 

-33 92 GAAGTTTTCA TGGGTTAGCT AGCTTCTATA GAAGGTTTGT TCCCAATTTT 

50 -3342 TCTAGCCTAG CTTCTCCCTT GAATGAACTT GTAAAAAAAG ATGTTGCATT 

-32 92 TTGTTGGAAT GAAAAGCATG AGCAAGCCTT TCAAAGGCTA AAAGCTCACT 

-3242 CACCAATGCA CCCATCCTAT CTCTTCCAAA TTTTTCCAAA CTTTTGGAGA 

-3192 TAGAGTGTGA TGCATCGGGA GTAGGCATAG TGC G GTTTTG TTGCAAGGTG 

-3142 GACACCCCTT GCTTATTTTA GTGAAAAACT CCATGGTGCC ACCCTCACTA 

55 -3092 CCCCACCTAT GACAAAGACT CTATGCTCTT GTGCGACCCT AAAGACTTGG 

-3042 GGAACACTAC CTTGnGTCCC AAAGAATTTG GnTATCCATA GTGATCACGA 

-2992 GTCTTTAAAA TATTTAAAGG GCCAACACAA GCTCAATAAG AGACATGCTA 

-2942 AATGGATGGA ATTTCTTGAA CAATTTCCTT ATGTCATCAA ATACAAGAAA 

-2892 GGGAGCACCA ATATAGTGGC CGATGCTCTT TCTAGACGGC ACACTCTCTT 
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TTCAAAACTA GGTGCCCAAA TTCTTGGATT TGACCACATA AGAGAGCTTT 
ATCAAGAAGA TCAAGAACTC TCATCCATCT ATGCCCAATG TCTACATAGA 
GCACAAGGAG GTTACTATGT GTCCGAGGGA TATCTTTTTA AAGAAGGAAA 
ACTTTGCATT CCCCAAGGAA CACATAGAAA ACTCCTTGTC AAAGAATCAC 
ATGAAGGGGG ACTCATGGGC CATTTTGGAG TTGATAAAAC TCTAGACTTT 
TAAAAGCAAA ATTTTGTTGG CCACACATGA GGAAAGATGT CCACGACATT 
GTCTAGAGTA TCTCATGTTT AAAAGCAAAG TCTAGAACAA TGCCGCTGGA 
CTCTACACCC CTTTGCCGAT TGCAAAGCTC CTTGTGAAGA CATTAGCATG 
GATTTCATTT TAGGACTTCC TAGGACTGCA AGAGGCCATG ACTCTATCTT 
TGTGGTAGTG GACCGTTTTA GCAAAATGTC TCACTTTATT CCATGCCACA 
AAGTAGATGA TGCTCAAAAT ATTTCTAAAC TCTTCTTTAG AGAAGTGGTG 
AGACTCCATG GTCTCCCTAG AAGTATAGTG TCCGATAGAG ATCACCTTAA 
ATATATAATT ATACACTTGT TTTTTTTCTC TTTTTTATTT TATCAAGTAA 
AAAGTATTTG TTCTAGATTA TTATGAGTAT ATACTTACTT TCTGTATTTC 
ATTTCTTTCT ATTTTTTATG ACGATGAAAT TTCTTATTAT ATCCAGACTT 
TTCATATATA TTTTTATTTC TTTTCCATCT AGATGCTCTG TACTTTTCTT 
CAGTTGAAAT TTCCACTCTC CAACAAAACA TCATTCAAGT TTTGTATAAC 
ACTGTGACGT TAACCAGTTA AAATAAGAAA ATCATGTAAT ATAAATTATT . 
TCAGTAGATA TTTTAGAATT ACAAATACGA TAAATAATTA AATTTAAAAA 
ATTATTAAAC AATGAATTTT TTTGGAAATT AATATAAAAC TTAGACTTGT 
GGTTTCTTCA TTCAGTCAAA ACCTTTTTCT ATTGTGTGGC GTGTGCGTGA 
ACATCGAATT TGGGTGCTTT ATGCCGCTTT ATCTTCATCT GCACCTTCAA 
ATTAATAATT TAATTCCGGA AAATAATAAA CCCACACACT GTTTTATGCA 
TATATTAAGA TAAATAAAAG AGAACTATTT TAAAGAATAT AAAATAATAA 
ATGTAACAAA TGATGTCACT AAAGAAGAAA AAAATTAACA AGAATTGTAA 
TATATTTCTT TATGAAATGT TTTGTGCATT ACCGAGAGAG GTCGAACATG 
ATACACGCAA GCATCTAACT AGTTTGGTAA TTCCTTTTCA ACATCGnTAA 
GCACATCACA CTAAAATTAC TTTAAATAGA TAAATTAGAT TCAATTGGAT 
GACATTAATT TATAATACTC TATCCAAAAT TATAACTATA AATAAAAAGT 
TATTTTTAGA AAATAAGTAA TGAAAATTTA ATTCTAAAAT TTATAACACT 
TTTATGCTGT GTTTGTTTCG AAGCATAGAA AAATAAAAAG TTATTGTTGG 
GAATGAAAAG TGAAGAAAAT CATGTAATAA AAACAAAATG ACACGACAAT 
CAAAAAAAAA GTTTTCATGC AAAACTTTTT TCAAAATTTA CACTTTTATG 
ATGTGTTTGT TTCGAAGTGT AGAAAAACGA AAAGTTATTA TTGGTAATGA 
AAAGCGAAGA AAATCACGTA ATAAAAACAA AGCAAGATGG CACGACAATC 
AAAAAAAAGT TTCTACACAA AACTTTATTC AAAATTTACA ACACTTTTAT 
GTTGTTGTTT GTTTCCGAGG TATAGAAAAA CAAAGAATTA GTGTTGGTAA 
TGAAAAGTGA AGAAAACCAT GTAATGAAAA CAAAATGGCA CGACAATCAA 
AAAAAGTTTT CACGCAAAAT TTTCTTCAAA ATTTATAACA TTTTCATGTT 
GTGTTTGTTT CAAAGCCTAG AAAAACGAAG AGTTACTATT GGTAATGAAA 
AGCGAAGAAA ACCACATAAT AAAAACAAAA TGGCACGACA ATCAAGAAAA 
AGTTTTCACA CAAAACTTTT TTCAAAATTT ACTATGTTTA TTTCGAAATT 
TAGAAAAACG AAGAGTTATT ATTAGTAATG AAAAGCGAAG AAAACTACGT 
AATAAAAAAC AAAATGGCAC GACAATAAAA AAAGTTTTCA CGCAAAATTT 
TCTTGGTGCG CAGAAAGTTA TATATATTAA TTAATTAATT TTCATTTACT 
TTTTTCCCTT TTTATTTTAA AGTTAAATTA TTATTATTTT CATTTAAAAT 
ATAAATATTA TTTAAATATA AAAAATATAA CCTTAATCAA AACAAAGCCT 
TAATCTAAAA TTTACAACAC TTTTAACCTT AAAATTAACT TTAAAAGGAA 
AATGATAGTG TGACAACTAA AAAAGTTGTA TACAACCCTG TCATAGGTTT 
AGAAATAAAT ATATATAATA AAGAGTAAAT TTGTAATTAA ATGATATAAA 
AAAGTATTAA AATAATAATA TTTAGAGTAG TAATATGGTT GTATAAAAAA 
ATGTGGTTGT CCATATATCA TTATTCACTT TAAAATATCA TGACAAATAT 
TTTCACCGAA AGATGGAAAG AACGAAAAGA GCGTTGGATA ATGGAAAAAT 
ACAAGCAATC TCCCTCCAGT ACTTTGCATA ACATTTTGTA TTAGTGATGA 

-GTTTT-TTATC ATATATAT-TT—AGAATATAGG-AAAAT-TT-TAG-AATGACGTGG 

ATAGCTATAT AATAGTAATA TTTTAATTTA TAATGTAGTT GATTTTATTT 
GTCAACTGGT ATACATAAAT ATGTGTTGAT AGTGGGTGAC TTGTGGCTTA 
AAGAAATGTC CAGAGGCTGA CAACAACTCT GCACAGACTA GCGTAAAC 
ATG AAG TCC AAT TTT GCT ATT TTC GTA GTC TTT TCT CTT CTT CTT 
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CTG GTACCTCTTCAATCTTCTCTACAAAAACTCTGTTGCTCTTTCACCTCTGTTTGTA 
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16 L 

160 ATTTTGTTTACACTTTTGGAAAATTGAAGCTGATATATATGTAACAACCTTTCAGTTTT 
219 GTCTGCACTGAAACTGATAGAAAAATATACGTTTTGTGGATATATATAG GTT GGC 

17 V G 
274 AGT TGC AGC TGC GCA AGA AAA GAC ATG AGA GGG TAT TGG AAG GAT 

19SCSCARKDMRGYWKD 
319 ATG ATG AAG GAG CAA CCT ATG CCA GAA GCA ATC AAA GAC CTT ATT 
34MMKEQPMPEAIKDL I 

GAG GAT TCA GAA GAA GTG TCA GAA GCA GGG AAG GGT CGT TTT GTT 
49EDSEEVS EAGKGRFV 

AGG GAC TTC GAT GTA AAG CCT AAT GTC ATA TTA TAT CAC ACA CAT 
64RDFDVKPNVILYHTH 

GTT GTG CCC ATG AAG CAG AGG CAG AAG AAT AAA GAT TGA 
79VVPMKQRQKNKD • 

4 93 AGACTATGTGATTGGCAGTTTCAGACTTATTTGGCACCAAATTTATGATGCTCTTGTTGCTG 

555 TTTCAAAATTTGTACTCAAACTTTGAACCCTTTGCAGCATCTTGCTTCTTTTTGGTCTTGCT 

617 GAATTTTGTCACAGTTATACTGTCACGAATAGTTTCTCTTCATAATAAGCAACTTTTCCTCT 

679 C 



SEQ ID NO:3 Scarlet Runner Bean G654 amino acid sequence 

57 ATG AAG TCC AAT TTT GCT ATT TTC GTA GTC TTT TCT CTT CTT CTT 
1MKSNFAI FVVFSLLL 
102 CTG GTACCTCTTCAATCTTCTCTACAAAAACTCTGTTGCTCTTTCACCTCTGTTTGTA 

16 L 

160 ATTTTGTTTACACTTTTGGAAAATTGAAGCTGATATATATGTAACAACCTTTCAGTTTT 
219 GTCTGCACTGAAACTGATAGAAAAATATACGTTTTGTGGATATATATAG GTT GGC 

17 V G 
274 AGT TGC AGC TGC GCA AGA AAA GAC ATG AGA GGG TAT TGG AAG GAT 

19SCSCARKDMRGYWKD 
319 ATG ATG AAG GAG CAA CCT ATG CCA GAA GCA ATC AAA GAC CTT ATT 
34MMKEQPMPEAIKDL I 

GAG GAT TCA GAA GAA GTG TCA GAA GCA GGG AAG GGT CGT TTT GTT 
49EDSEEVS EAGKGRFV 

AGG GAC TTC GAT GTA AAG CCT AAT GTC ATA TTA TAT CAC ACA CAT 
64RDFDVKPNVILYHTH 

GTT GTG CCC ATG AAG CAG AGG CAG AAG AAT AAA GAT TGA 
79VVPMKQRQKNKD • 



SEQ ID NO:4 Arabidopsis G654 genomic region 

101001 CAAAACAAAAGCAAATGCCGGTTTTCTTATTATTATTTCGAACTTTAGAC 
100151 CTTTTTGTAACGTTTCTTTAATTTTTTTCCTTGATAAAGAACCCTATTAT 

1002 01 ATCTTAGCTAAATATTTACCTCATTTTGTTTATGAGCTAAACCACCCCAA 
100251 AAATATTGTAGTTTTGCTTTCGGATTTAACTGCCAAGCAAGTGATTAGAT 

1003 01 ATATTAAAGGAAAATGAATGAAAGGACAAAAAAATATAAACGACAATATT 
100351 TGAATACTGATATTTATCTCCATTCTCAAATATTTTTGATTTATTGTGAC 
100401 AATATTTGGTTGTTTCCCATTTGCTACATCTTTGAGGACATGAAATGATA 
100451 ACATATATATGAACGAGTATAATACATTCTCGTTTCATTTTACAAATAAT 
100501 GTCAATTTATGCTAACATTTTTTATTTAAAAATTATCCTTATAAGATTTC 

— 10 0 55-1- -AGTGTATTATTTTACCATGGTACTGTAAAGTCGGATGCTATATATATATA 
100601 TATATATATATATATCAAAAATGACACTGAAGAATTTATTTGAACTAAAA 
100651 CTAAAAACGTAAAATAAAAAGAATTTTTCAAAAATCAAAAATTTTATATA 
100701 AAAATATAGATAAAATGTTAATATAGTACAACTTCTATTCAAACAGAGAG 
100751 AATAAATCTTCTATAGACAGTGAATATCCATTATAATAACGAGCAATAGT 
100801 TGTAATGTTGCAGTACAAAAAGAGAATTGTAATATTTGTGCATGATTGAG 
100851 AAATCTAAGTTGACTTTGAATTAAAAGGCTAATTCCAACAAGTACATGTA 
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100901 GAAGTTGACTATAGCTATATATTTACTACAAATTGATCATTTCAAGAAAG 
100951 ACATTTAAATTAAGATATGCATGCATGACTTGATTGAACCCCACTCGCTT 
101001 GCTTCGTGCCATTCGACAAGATGTTACTTTTAAATGCAAGGTAAATTATG 
101051 GATATACTCTTCTGTATTTTTTGTAGTAGATATTTTTACGAAAATTGTTT 
5 101101 TTTTTCCAAAATCAAATGATATTTATTAATTTTCAATATAGAATTAATTA 
101151 AATTTTAATTAATTTTGAAGATTTATATGCTGCAGATTAGATTACCATTG 
101201 GTGAAATCATGTTT AGGTAAATAATAAATGATGTTGTAGTTTAGG AAAAA 
101251 AAAAAATTCTTTAATCTTTATGTAAGAATGTTAAACTTCAATTAT AAAAA 
101301 TATGAAGCAGTATTATATAAGATGTTTAACTAATCGAATAATATTTTTTG 
10 101351 GGATGAAATTTTCTTGCATATGTTTCTAAAAAAATAATATGTGAAAAATT 
101401 AACATTCATTGTATGTTTATAAGAAATATATGTGAGTTTTGTTTAGATAA 
101451 AT AAT ACTT AAAATTAAGAATTTGT AAAGTTATACTGCACTTC AAATATG 
101501 TTATTTTTTCCTTTTATTTAAAATATCAGCAACATTCTAAATGATTTTAT 
101551 TTTCTTTAAAAAATTGAAAAAATGAAATTAGCAAATATGTAAAATTTAAA 
15 101601 ACGAATTTAAGAAAAAACTTTGTAAAGATATGATATGCTTTATAAAAAAA 
101651 ACTTGGTGGCGTACCTACTAAATATGATCACATTAGAGATTTGTATCCTT 
101701 TAGCATATAGTATGTAGTATAGATATCTATATTTTTATTTATTAAAGAGC 
101751 ATATTCATAATATAGGTATTATATGTTAATTACAATAAACGTTCAATTCG 
101801 TTATGTTAGTTTTTAGAAAACTTATTGCGTGTGCATATCAATGTGAGAAA 
20 101851 GCGACTCCACATGTGAGATGTTGGTCTGAGAAAGCTTTCTGCACTTGGTC 
101901 GGAACTACTTCATGGACTAGAATGCAATCCATCTATTCAAAGAAAAGCAG 
101951 TTGTCCATGCATGCCTCGGTTTTTCACATTTGGAAGCAGCGCAACAATGT 
□ 102 001 CTTACATAATATGCGATCGATCACTCTGCAACCAATATTCAAGTACATAG 
Q 102 051 ACCATGACATCAAAAACATTATCACACCGAGAAGAAAGAAACGTCAATTT 
"25 102101 GGTAACTTAATGGCGTTATGCCTGCGGTGAATTCTCCTAAGAGTTCTCCC 
f U 102151 AAATTTTATTGATTCCTTGTTTTTAACTTTTTCGCCAAAGAATCATACAT 
'i; 102201 ATAGATTTGACACCATTTCAACTTATCAAATACAAGTGAATAAATAATTT 
7x 102251 CAAGCTTGAAAGGAATTTAATCATGATCTAAACCTAAACGACAAATTCTT 
j : % 1023 01 CACAAGTGAGAATCACTAATTGACTACCCCTTGGTCGCATATACATCATT 
;5p 102351 GTTGTAAATCTGAAAATTGGTTTGGATTTGATCTGATATGTCATTCATAT 
" ^ 102401 AAAACTTGTATTATTTATTTTAGAATTTTGCCGCAAACAGATAAATCATC 
102451 ATCTATTTAGAAAATTTTCATTTGCACCACAATTAATCAGGGGAAAAGGT 
M r 102501 GAAATCACATATCTTATCTACACTCTTTATTAATTAAACGCCATAATATA 
102551 ACAAATTTTCAAATACCACTTATGAGAAGCACTAAGATCACCTTTTTCTT 
;3 : 5 102601 TATGACTTTCTTTCTAAAGCTAAGCTGGTAGTCATGACTCATGATTATCC 
rS 102651 TTTTCCTAATGGGAATATTGTGGAAGCGGTTTCAAATCTTTAGACAAAAT 
102701 TCCATGGCCACTAAAAGTTAGCAAAGTTAAAATAAGTTTAAAAAAATATG 
'12 102751 AGTGTACTTGGCCATATGCCATATTGTTGAGATCATAACAAGAGAAATAA 
;= ^ 102801 TAGTTTATTGAAGTTTAGATCATAATCACAATACATCATTGCCTTCATCA 
40 102851 ACATTTTCCATGGATTTGAGAGGATCAACTTCAATACTAATGGTGGGGTC 
102 901 TTATTCATCCATTGCTCTCTAGCCAATTAAGCAGTTAGGTTATTTGTGTA 

102 951 CTCTAGTAGTTGCCAAATCAATCTTAATATTCACAATGTTGTAATTTCTA 
103001 ATTACGTATAGATAAATGACTAGATAACACGTGGCTTTGGTTTTATCAGG 

103 051 AAAGTTTTCCAAATCATATATATGAATGTAGAATAGTGTTCTTCATTAAT 
45 103101 TATTAATTAGCATCTCACCATCTGAGACTGGGAGCATGTGACAAGTTGAC 

103151 ATGTGTATTAAGAGAACTTTGAGAAAACCACTTTTATGATACTCCCATCT 

1032 01 GAGACTGGGATGAGTACCATTTTATAAAAATATGAGTAGTGAAAAAATAT 
103251 TCAAAAAAAATTCTAACATGTCCTTTAAAACATTTTAACCTTATAATTTT 

1033 01 AACAAACATCTTCCAATATGCGTTATGAAAACTTTATAAAACTTTTTTAT 
50 103351 AACATGCTTTTGAAAATTTTATAAATCTGTATTTTTAGAAACAAAGTGAT 

103401 ACTTTTGAAAATAGACAAATGAAGTGCTATTTTTTAAAATTGATATCATA 
103451 AGTCTTAACTGTGGTTTGTTTGAATTTTATTTATATACTTGTCAAAATAA 
103501 AACTAAATAAATAAATTAAATTATTTTATAATCATGAAGATAATATTATC 
103551 ATAAAAGATAAATATAAAATCAACAAATTTATATTTGTTAATAAAAATAC 

_55 10360-1— T-T-TGAGCTCT-TCT-TC 

103651 TAAATTAAAAGATAAATAACCGAATAAACATAGTTCACATTCTAACTCTT 
103701 AGTCTTAGATTTGTTTTAATTTTCAAAGGTTTAGGTATTGTATATGTTTT 
103751 TTTTATTGGGTTGCTAGATTTTGATCCAAGAAGAAATGACGGGTTGTAGT 
103801 ATAGATGGTTTGTTTGAGTTTTTTCCCCTTGGTTTACTTCGTTTGGTTTT 
60 103851 TGTCCCCAGAATTGTTCTTGTACTCGCTGGTTTATGTCTCTACAAAGTCC 
103901 ACGACCATTGCCGGCTCTTTGTATTTCAACTTGAATTCTAAATTCGATTG 
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103 951 ATGAAAAAAAAATGTATCTCTTAAAGTCCATTAGTACCAAAAATAACTAT 

104 001 ATCATTACTACATAAAATAGTCTTGGGTTTTCCAAAGTATTTCGTTGATA 
104051 TATGTTAAGAGTTCGAAATAGACACATAGATATAATGTTGAAATGGGACC 
104101 TCTCACATAATTATCTCCTTTTCTCTTCATTTCTCTACCTCTCAAGTTTC 

5 104151 CAATCCCACCCTAAGGTAATTTATTTCTTAACCTAAGTAAATTTGTTAAC 
104201 AAATCTTAACT AGCTACAAATGTGTATTAC AAGTCTT AAAT AAAAACCTA 
104251 CTTTAATTCAAAGGTATTAAACCTTCCTAAATTGATACTTACTTAGTATC 
104301 GATCGGTCTAGTTTAGGGTTTGGACAACACACCATCATGGGGACGAAATT 
104351 AGTCATTCTACGGTGTCCAAGACACAAATCTCGGACTCGATGTGGATATG 
10 104401 ACACTTCATTATAACTTTTAACTTCATAAAAACTAACTATTAGGAGGAAG 
104451 AATCGGAATCTGCATATCAATCACAATAGACTATAGTATACTTAGATTTT 
104501 GATCTAATCAATGGGCTCCTTCAACTAATAAGTAGCCCACTACCAATAAT 
104 551 GAAATCATAAGACATTATTAAATTAATCAATGTTCTAAAAATACTTTGGT 
104601 TATGTGTCCCGTAGAGCTAATGTGCACACACAATGAAAGTTGACCCGTTT 
15 104651 CACTTGTCCCACTTTTATGATCTTTTCTTTTAGGTTAAATCCAACTTTTA 
1047 01 TAATCTCATCTTGTTATCAAACAAAACTTTTGGCCTGTCTTTTTCATAAT 
104 751 TTAAAGTAACTCTCACGGAGAAAAGCCAACATTTTCTTCTTGTTTTATTC 
104 801 TTTTTAAGAAAAATGAATTCAAGGGGACCCCAAATTTAAAAGGAAAACCA 
104 851 AAACTCCTTTCTATGTATTTATTACTTGAAGTTTTCTATGTAATCAACAA 
20 104901 TCCTAACAGTAGAGAATAAAAAACATCGTTTTGGGAGGTTTTATATTAGC 
104 951 ATATGAGAATAGTTCTAAAATTGTTTTACACAAAAATTAGATTTTCTTTT 
105001 CCTCTGTCAATGGAGCTATATCACTTGTCATTTTGCTTAACCCTTTGCGG 
£3 105051 GAAGATTGTTATGAAACAGTTTTAATGGAATTCTAGTTGCCAATGTCACG 
; i3 105101 TTTAATATGTTTTGTCCCTATACTTTATTGAATCTTATAATCTTTGTTAT 
: 2|5 105151 AGAATTATCTACTTTTAGTATTTTACATTAACATAATCTATAGAATTCTT 
r;i 105201 CTTTGTTCTATACAATTAAACAAGTAATATATTCTTAATACATATTAAAA 
' == 105251 ATGGTGGTGTTGCTATCTGAGCTGTAATAGTTGATTGCTCCAGAGAAGAA 
'.I a 1053 01 TAGACAAAAATCCTTACTTAAGAGGCCCACCACTCTGAAAATTTAGACAA 
1053 51 GAAAAATTAAACAAAATTAGGTTACACATATTATCATTTATATATATGCA 
;;Sp 105401 CAACACAAAGTTGACCTTGCAATGTACTATTGAATAAAATAAATAAATGC 
105451 AAGAAGAGAGGGAATTATCACTGTTACCAAGAAAACAACTTCCTCTAAAC 
105501 AGGTCTCTATATATATAAACTTTAACACCTAAAGAATTAACACAGATCAA 
N= 105551 GAAAAAATCCTCAAAACAAAAGTTAAAGCAGAC ATG AAG CAA CAG CAA 
I- 1 M K Q Q Q 

135 105599 CGT TAC TTG GTC GTC TTC ATC GTC CTT TTA AGC TTT CTT 
f;Q 6RYLVVF IVLLS FL 

j != J 105638 CTG GTAAAGCTTCTTCCTTAATTATATTAAAACCCTAATTAAGATCTCATATA 
19 L 

105691 ' TCTGAATGTTGTATATATTTGTTGGTATAG TTT GTG AAT CTG AGT 

40 20 F V N L S 

105736 GAA GGA AGA ACA GGA GGA GTT GCA GAA GAA TAT TGG AAG 

25EGRTGGVAEEYWK 
105775 AAG ATG ATG AAG AAT GAA CCG TTG CCT GAA CCA ATC AAA 
38KMMKNE PLPEP I K 

45 105814 GAG CTT CTC AAC AAT CCT TTT AGG ACC GCA CAA GAG AGA 
51ELLNNP FRTAQER 
105853 TTC ATC CAG AAT TTC GAC ACC AAA TCT GTT GTC ATC ATC 

64 F I QNFDTKSVVI I 
105892 TAC CAC AAT CCT AAT GAA TAA TCAATGAAGTCTCTCATATAG 

50 77 YHNPNE* 

105934 ATATCTATGACTTTAATTTGTGTTTATGTATGGATCGACTTATACGTGCA 
105984 CGTATATGTTATTAATTAAGAAAAGAAAAAGCTGCTTGAGTTGTTGTGTT 
106034 ATACACGTATACTAAATATGTTCTGTTTAGTGCAGAAATGTTAACCCTAG 
106094 CTATAAGGG ATTTTTTGTTCTTTTTTTTTTGTT ACC ATTAATGTGAGTG A 

55 i0_6 14 4_GTGAGTTTTGTGTGATG 

106194 TATATAAATCAATATACTGTGCCTTTCGTGTCTTGTTTCTTATATTATTT 
106244 TGTGACATTAATTAATTATCTTATCAAAAATTTATTTTATTAACTGTGTC 
1062 94 CTATGGAAAAAGATGAACAATATGAGTTAACCTCATCTCAAGGAGATTCT 
106344 TTTTTGTTTTGTTTTTC 

60 
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SEQ ID N0:5 Arabidopsis G654 amino acid sequence 

M K Q Q Q 

105599 CGT TAC TTG GTC GTC TTC ATC GTC CTT TTA AGC TTT CTT 
6RYLVVF IVLLS FL 
5 105638 CTG GTAAAGCTTCTTCCTTAATTATATTAAAACCCTAATTAAGATCTCATATA 

19 L 

105691 TCTGAATGTTGTATATATTTGTTGGTATAG TTT GTG AAT CTG AGT 

20 F V N L S 
105736 GAA GGA AGA ACA GGA GGA GTT GCA GAA GAA TAT TGG AAG 

10 25 EGRTGGVAEEYWK 

105775 AAG ATG ATG AAG AAT GAA CCG TTG CCT GAA CCA ATC AAA 

38KMMKNEPLPEP I K 
105814 GAG CTT CTC AAC AAT CCT TTT AGG ACC GCA CAA GAG AGA 
51ELLNNPFRTAQER 
15 105853 TTC ATC CAG AAT TTC GAC ACC AAA TCT GTT GTC ATC ATC 
64 F I QNFDTKSVV I I 
105892 TAC CAC AAT CCT AAT GAA TAA TCAATGAAGTCTCTCATATAG 
77 Y H N P N E • 



20 SEQ ID NO:6 Scarlet Runner Bean C541 genomic region 

1 AAGCTTTACAAATGTCCCCCAAAGATGAAACCACGTTATTATTAGTAAATCCTGAAAAGG 
A 6 1 TTAACGCTTCTGTTCCTCGAATTCTAAACCATCTGAAATATCTAGTGGTTTAAAATGGAG 

12 1 ACTTGAGGATATAGTCTCCTGAACCAGCTGTCACGGCTGAGTTAGATAACATTACTGAAT 
1 « 181 TTCTACGGGAGCGGTTGAAATCACTTTCGCCCCTTTAAGAAGAAGCCTACACCGGGCACC 

'25 241 TTCTTTACGCAATTCGAAATTTAGTCTTGCCAGGCAGTCGTTGGATCGAAGGTCTTTTTC 
j= 9 3 01 GATACCGAGGAATCTGACTTTGCAAGGAATAATTCCTAATCACACCACCCCAACCCCTGA 

vl 361 ATACACTTCAGGACCCTCTGAAACCAACTTCGTTTCGGCTAAATCACAAGAATCTCCCAC 

: 1 4 421 TCATTCCGATTTTAGCCAATTAAATATGATATCGGTCTGGGAAGCCGATAAGGAAATTCT 

4 81 ACAAAAAGAGTTTATGAATGAGGAAAATAAGGAAAAGAGAGAACTATTTTTTAGGTACCC 
=3P 541 TGAAAGAGAACGAGAAAAATTTAGAAAAAAATACTACTCTCATCTGTACACTGTTCAAAA 
L 601 GAATATCCnnnnnAATGGTTAGATAATATAAGAAAAGGATAAGTATGATTAAACTGAAAC 

|: ~I 661 CACGTCGGCAGAAACAAAGTGAATTCCCCCCTTTAGAGGAAGTTCGTTTCTTAAATATAG 

[ ~ 721 AAAACAAAGAAGTAGTCGCCTCCCCTTTTAAAATGATCTCAGAAAAACGAGAAGTAAGTA 

7 81 TAAAAGATATTCAAAATCTACACAGTCAACTAAATTTTACTAATCAAATGCTTTTTCAAT 
=35 841 TAGCAAATAAAAAACAAAAGAAAAAAGmGAAAATTGAAGAAAAATCGTTAATAAAACCAT 
□ 901 TTAAATTCTCAGAAGAAGAGATAAAACAGTTAAAAATTGGTCAAACTTTGGATTCTTTAT 

961 ACGATGAAGTAAAACAAAAGTTATCTATCTCGGTAATAAAAGAAAAACCGAAATCTAATA 
1021 ATGATATGCCCAAAAGGACAAATCCAAATCAAGAAGTTTTAGACGAAATCGAAAAGAGAT 
1081 TAAAACAAACTCTGAACGACACAATAAATGTGATAGAAGAAACTAAAAACTCAGACTCAT 
40 1141 GTTCAGAGTCTCCCGATCGTATTGAAAAAATAAAACGTAATAAATCAGAGATTTCCAGTA 
12 01 AGCCGAAATTTTTACACTCGCCCCACCTTCGATATCATCGAGATGGCGATGGACACCTCA 

12 61 GCATTGATGGAATGGATACTGAGTGATATGATGGATGACAGATGATGAATATAGAAAAAC 
1321 TCACGAAATAACAATGGCCGCTACAGCATATAGAGTAAAACATACCGAGGAACAAACAAT 

13 81 AAAATTAATTATATCTGGATTCACGGGAGTATTAAAAGGCTGGTGGGATAATTACCTCAT 
45 1441 GCCAGAACAAAAGAATTATGTTCTAAGCTGTGTAAAAATAGAAAACGAAGAAGGAATACC 

1501 ACTAATGGTGGAAACATTGGTGGTAGCAATAATTCATAACTTTATAGGAGATCCAAAGAT 
1561 TTTTGAAGAAAGAACATCTTTATTACTTCATAATCTAAGATGTCCAACCTTAGGTGACTT . 
1621 TAGATGGTATTCAGAAAATTTTTTAGCTATGGTTTTAACAAGGGAAGATTGTAGAGAACC 
1681 TTTCTGGAAAGAACGGTTTATAGCTGGATTACCGGATATCTTTGCTGAAAAGGTAAAAGA 

50 1741 AAATTTACAAAAGGAATGCCCAAACACCCAATTAAAAGATGTACCATACGGGAAAATAAG 
1801 TTCAGTTGTAAAAAATACAGGTCTTCAGTTATGCAATAATATGAAAATAGAAAATAAGAT 
1861 AAAAAAGAGTGAGAGTCAGGGCATCAAGGAATTAGGGGAATTTTGTACTCAATACGGTTA 

1 9 21 -TGAACGAAATAGGGCTCCATCAAAAAATAAAAAGAAAATAGCAAAAAGAAGAACAgGGAG^ 

1981 AAACAAGCGCTAAAACAAGCGCTAAACCAGCACGTAAAAATTTTAGAAAAACGGTTAATT 

55 2 041 TTAGAAAACC ATG AAAGTCTAATGATAAGCCCACT ATAGTCTGTTATAAATGTGGACGCA 
2101 TAGGACACATGAAGCGAGACTGTAGACTAAAAGAAAAAATTAGTAATTTGACCATAAGTG 
2161 ATGAATTAAAAGAACAAATGGAAAAACTTCTGATAAATTCCTCCAGAAGAGGAAGAAACA 
2221 GAAGAATCAATAGGAGATTCTGATTACGAAGTATTGGACATGAGGATAACAATTGTAATT 
2281 GTGTCTATAAAATAAATACGATAAGTAGTGAATTAAAATTTGCGTTAGATTGCATTGATA 
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2341 AAATTAATAATCCGGAGGAAAAGACCAAAGCCTTAATAGACATGAAAAGGCTACTCGTTG 
2401 AAAAAGATGAACCCAGTTCATCTTCACAAAAACCTGAATTTATAGGATATGATTTTAAAG 
2461 AAATATTGAGAAAAGCGAAAACATCACATAAAGAAATAACCATTAGCGATCTTAATAGTG 
2 521 AAATAAATAAATTAAAAGCCGAAATCGAATCTATAAAAGTCGAGCTACAAGAATTAAAAG 
5 2 581 ATAAAATTATACATGAGGAATCCATCTCCTCTGCCGACGAAAATTCACAAGAAGAGGAAG 
2641 CTAGTAGACCTTCCATCAAAGAAATAACATACAAAAGACAAAAGTGGCATGTAAAAATAG 
2 701 CCCTAGAATTTGTTTGTTTTGTGACCGTTTCATTGTGGTCAAAGATGAGTCCTTACCTAA 
2761 CACAATAAAAAACGTTACTCTTAAATATCAAAGGAGAGCTACAAATATCAATGAATGAAT 
2821 GACATTAATATTTTTCTTTAGTTTTAAAACTTGAATGAGTTGTTTTCATAAATATCTGAC 

10 2 881 TGACTGACATTTTTATTTTTTCTGAAAATGAGGAAGGTTTATTACGTTAACACCATATAT 
2 941 ATATTTTTATCTCAAAGTCAACGAAATATTATAAAAGAATCAATTAAAAAAAATTATTCT 
3001 TTTGCAGAAAAAAAAATTAAAAATATGAAACTCCTCCACACCATATTACCATATTATAAA 
3061 TATAAAAAAACCTCTCACAAATGTGCATTCTGGAATTCTTTATGTTGAGAGATTAATCTC 
3121 TAAAGAAAAAAGGTTGAGAAAGGTGCAGCAACA ATG TCT CCA TTC TGT AGA 

15 1 MSPFCR 





3172 


AAC 


TTT 


TCA 


ATG 


GCA 


TGG 


GTG 


CTT 


ATG 


GCA 


TTT 


GTG 


TTG 


TTT 




7 


N 


F 


S 


M 


A 


W 


V 


L 


M 


A 


F 


V 


L 


F 




3214 


GCA 


AAC 


AGT 


GCT 


ATG 


CCC 


ACA 


AAT 


GGA 


TCC 


ACT 


GTT 


GGG 


GTA 




21 


A 


N 


S 


A 


M 


p 


T 


N 


G 


S 


T 


V 


G 


V 


20 


3256 


AAA 


AAC 


ATG 


TTG 


GGT 


GGT 


AAA 


TTG 


ATG 


CTA 


AAC 


GTT 


TTA 


TGT 




35 


K 


N 


M 


L 


G 


G 


K 


L 


M 


L 


N 


V 


L 


C 




3298 


CCC 


CAT 


ATT 


GAT 


AAG 


CAA 


CAC 


ATT 


ATC 


CCG 


AAT 


GGT 


GGT 


TCA 




49 


p 


H 


I 


D 


K 


Q 


H 


I 


I 


P 


N 


G 


G 


S 




3340 


TTT 


GAG 


TGG 


AAG 


TAC 


AAT 


GGT 


GGT 


GCT 


CCA 


CCA 


ATA 


GGA 


CAA 


is 


63 


F 


E 


W 


K 


Y 


N 


G 


G 


A 


P 


P 


I 


G 


Q 




3382 


TCA 


CCA 


TTC 


ATG 


TGT 


TTC 


TTT 


CGG 


TGG 


AAT 


AAT 


GTT 


CAT 


CAC 




77 


S 


P 


F 


M 


C 


F 


F 


R 


W 


N 


N 


V 


H 


H 




3424 


TCC 


CTT 


GAT 


CTG 


TGT 


TCA 


CCA 


AGC 


AAG 


TAT 


ACT 


GGT 


TGT 


GAA 




91 


S 


L 


D 


L 


C 


S 


P 


S 


K 


Y 


T 


G 


C 


E 


%> 


3466 


AAT 


GCC 


ATT 


TGG 


GAA 


ATC 


AAA 


GAA 


AAG 


CAA 


TTT 


TGT 


AGG 


TAC 




105 


N 


A 


I 


W 


E 


I 


K 


E 


K 


Q 


F 


C 


R 


Y 




3508 


AGA 


GGT 


GGA 


CCT 


ATT 


AAT 


TAT 


TTT 


TGC 


TAT 


GAC 


TGG 


GAT 


GAT 




119 


R 


G 


G 


P 


I 


N 


Y 


F 


C 


Y 


D 


W 


D 


D 



3550 TAG TTATATAGATTATTCATGTTTCATCTCAATAAAAAAATGACTTTAGAGTGATTCTT 

m 

ij S 3609 AGTTTGCTTAACATTCTTACATATTCCTAACTATTCCGTCACTACCACCCGTAACTATAT 
p 3669 TTATTTAAAATTAGTATCTGTCACAGTTTTATTTTTAAAAAAGGTTATGTGGATTAGAAG 
r 3 372 9 AGAGATAAATATGTAGACGGTCACCAACCTTAATTTTTGAACTATGTAAGACTATATTGA 

37 89 CCAAGAATATATGTTTAAACTCATTCATTTAAAGACTATATCTCCATTTATGATTATGCA 
40 3 849 AATGCAATTAGTTTTTTTTTTCATTGAAGAATTCAAAAGAAAGTTATCATTAAAAAGTAT 

3909 CATTAAATCACTTATATGTTGTTTCTTAATATCCTTATTGTTAATAGAATAATTTTTTTT 

3 969 ATCCTTTAATTAAGGTTATTACTACTTTTTTTTCATATCTTCATTATTTTGAAATATTTT 

4 029 TAAAATTTATCAATTTTTGTAACACCCCAGAAAATACATGTAACTATCACTTTTTTTTTA 
4 089 TATTACAAATTTATGACTTATAGAAATACAAATATTAAAAATATAAGGTTCAAAACTACA 

45 4149 TCCTAAAGTCTTTCAGACCCTCTGACACATGTATCATCTGCTCGTATATGTGATACAGTC 
42 09 ATCGCAGTTCACAAGATAACAAGAAAACCAAGGGTAAGCTAATGAAAAAAAATTCCATAA 
42 69 CATATTTAATTCATGCAAAAAGAACCAGTCAAAGTAATCATTTATAAACATTTCTTTAAA 
4329 TATTGTTATATAAAATTTCAATATCAATTTCATCATTCATATAGACCACACATGGATCTA 
4389 TTTTCAATCACAATCATTGGATTTCATTTTAATCCTACTTCGnCTTCCAGAAGACTCATT 

50 444 9 AAGTATGCCCCTACCAGAGACTAACACCTAATCAAAGAGAAATGATCAAGGTAAGTTCAA 
4509 ACATCCAATAACGAGTGCCTACAGTGGGACCCAATGTGTATGAACTCCTTATCAGCTTCT 
4569 CACCACCTGATATCTTATTCTATATGACGTAGATCATCAGTGAAACTAGAGGATCTCCGT 
462 9 TAAACATATGTTTTTTATACTTAATGTCATCAAACAACAACTCACACATTATCCCAAATG 
4689 TATGACATCAATTTCATACAATTTTCATCATTCATATATAATACATATCATTGAATCACA 

55 474 9 TAA^TTTAAAAATT^ 

4 8~0 1ST TCAAACTATCAAAATATAATTATTATTTAATAAAGCT t 
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SEQ ID N0:7 Scarlet Runner Bean C541 amino acid sequence 



ATG TCT CCA TTC TGT AGA 
M S P F C R 



J ± / Z 


7a a i" 1 
AAL 


TTT 


TCA 


ATG 


GCA 


TGG 


GTG 


CTT 


ATG 


GCA 


TTT 


GTG 


TTG 


TTT 


n 
1 


XT 


c 
r 


S 


M 


A 


W 


V 


L 


M 


A 


F 


V 


L 


F 




VjL.A 


AAC 


AGT 


GCT 


ATG 


CCC 


ACA 


AAT 


GGA 


TCC 


ACT 


GTT 


GGG 


GTA 




A 




a 


A 


M 


P 


T 


N 


. G 


S 


T 


V 


G 


V 


J Z 3D 


A 7\ A 

AAA 


AAC 


ATG 


TTG 


GGT 


GGT 


AAA 


TTG 


ATG 


CTA 


AAC 


GTT 


TTA 


TGT 




K 


N 


M 


L 


G 


G 


K 


L 


M 


L 


N 


V 


L 


C 


3298 


CCC 


CAT 


ATT 


GAT 


AAG 


CAA 


CAC 


ATT 


ATC 


CCG 


AAT 


GGT 


GGT 


TCA 


49 


p 


H 


I 


D 


K 


Q 


H 


I 


I 


P 


N 


G 


G 


S 


3340 


TTT 


GAG 


TGG 


AAG 


TAC 


AAT 


GGT 


GGT 


GCT 


CCA 


CCA 


ATA 


GGA 


CAA 


63 


F 


E 


W 


K 


Y 


N 


G 


G 


A 


P 


P 


I 


G 


Q 


3382 


TCA 


CCA 


TTC 


ATG 


TGT 


TTC 


TTT 


CGG 


TGG 


AAT 


AAT 


GTT 


CAT 


CAC 


77 
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F 
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N 


V 


H 


H 


3424 


TCC 


CTT 


GAT 


CTG 


TGT 


TCA 


CCA 


AGC 


AAG 


TAT 


ACT 


GGT 


TGT 


GAA 


91 


S 


L 


D 


L 


C 


S 


P 


S 


K 


Y 


T 


G 


C 


E 


3466 


AAT 


GCC 


ATT 


TGG 


GAA 


ATC 


AAA 


GAA 


AAG 


CAA 


TTT 


TGT 


AGG 


TAC 


105 


N 


A 


I 


W 


E 


I 


K 


E 


K 


Q 


F 


C 


R 


Y 


3508 


AGA 


GGT 


GGA 


CCT 


ATT 


AAT 


TAT 


TTT 


TGC 


TAT 


GAC 


TGG 


GAT 


GAT 


119 


R 


G 


G 
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I 
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Y 


F 


C 


Y 


D 


W 


D 


D 


3550 


TAG 





























SEQ ID NO:8 Arabidopsis C541 genomic region 

142000 TTATCTTATTTCCATATAATTGTTGTTTTACTTTCAAAATTTTTAATTTT 

141950 TTATATTTATCTTTTTACAGTTTAAAATTaATAAAATGAaACTTTTTTTC 

141900 TTAaATGTGTTAAaATATAAaATCaAAAAAGTTGTTATATGGTACATGGC 

14 1850 ACAATCTTATaAATTATTAATTTGAaAACGATACTTTATATAATAAAATT 

141800 ATCTTAGTTGACATTTTTATTAGTGTTTTCAATCATATTTTTGTTTGCTT 

141750 GATAAGCGTaaAACaAATCaAACTTAACGATACTTTATATAATAAAATTA 

141700 TCTTAGTTGACATTTTTATTAGTGTCTTCAATCATATCTTTGTTTGCTTG 

141650 ATAAGCGTAAAAC aAATCAAGTaAAGTTGGGCACCTCAATTGTTTTAAAA 

141600 AAGTTTGGGTACCTCaaaAATTAATAGGTCTTGTCAGATTCTTACAAaAA 

141550 aAATCTGGAAGAATTTATGAAAGAAGGGGGGGGAGGGGGGGAGGGGGGGG 

141500 AAGTGAAGATGAATATTCAACAAAAGAGGGTAGGCATGATGTTAAGTGAG 

141450 TTAAAAAACTATGTTAATGGAGACAATTTTCTGTTAACAAACCCGTTAAT 

1414 00 TGAAAACGATAGCATTCTTCTCTAACAATGTAAAACGATATTGTTTTATC 

141350 ATAACTACTCATTaaATTTCTGAGTTTCAAATCATATAAAGATTTAGGGG 

141300 GGTGTATTCAATTAAGGATTTGaAATGATTTGTATTAaAATGACAAATCC 

141250 CATGTTATTTCAAACATGaATTGTAAAAACTTTTTTAAaATCAAGTGTTA 

141200 TTAGATTAGTGATTTTaaAATGTACAACCAAACCCACTGTTATTGGAaAC 

141150 ATTTTAAGTAGTGGATTTAAAATGACTTGAGTGATTTTGGGTGGGATTGC 

141100 AGAAAATTTCTTAGTTAAGAATTCAAACATCCAAATCTCATGGTTTCAAG 

141050 TAGAATTTGGGAGAATTTTAATAACAAATCTCCTAATTTACCAAAAGTCA 

141000 CCaAAATCATTTaaaAACTCATTaaAATTTAAATGATTTCAAATCTCCAG 

14 0950 TTGAATACATCCCCTTGGAATTAGAGATTTTGCTCGATTTGGGACCTAAG 

140900 ATTGAATTTTGGGGATTTAGTTTAATCGTTACAACAAAATGACATCGTAT 

140850 TATTGTTATAGGAAACAATGTCGTTTTCAGTTGACATGTATGTTAATAGA 

14 0800 AAATTAACTCTATTAACGGGATTTGCTAACCCATTTAACATCGTAACTAA 

140750 ATGGTCAAGTCAATaaAAGTTTGGTATTTATTTGaAAAGTCAACGTAAGT 
1407.00 — T-TGATAT-T-TAT-T^ 

140650 GACAGACATAAGGATTTACATCAATGTTTTTAATAAATTAAAGATTATTA 

140600 TGACATTTTTTCCATTTaAAATTGCCAATGTTTTCGAAACCAAGATACTC 

140550 aAAATTGACATACCTAATTCAATCTACATTTGTTTGACAGCAATTCACGT 

140500 GCCTTGACCACATGGCACATACTGGCAATACATCAATTTTAAGGAAaAGG 

140450 TAGATTCGGATACAATATAATGGAaATAAGTGGAaAGGATCATTGACTAC 

140400 TTGACTTGTAACAaACAACACACAGTATATAACTCATTCGACATTTACAA 
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140350 ACAACATTGTGCTAGCTTAAACTCCCTCTCCTATTCAAAAAA ATG 
1 M 



140305 


GAT 


ATT 


CCA 


AAG 


CAA 


TAT 


CTA 


TCA 


CTA 


TTC 


ATA 


TTG 
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L 


140269 


ATT 


ATC 


TTC 


ATA 
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ACA 


AAA 


TTA 


TCA 


CAA 


GCC 


GAC 


14 
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I 
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D 


140233 


CAT 


AAA 


AAC 


GAC 


ATT 


CCA 


GTT 


CCC 


AAC 


GAT 


CCA 


TCA 


26 


H 


K 


N 


D 
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P 


V 


P 


N 


D 


P 


S 


140197 


TCA 


ACA 


AAT 


TCT 


GTG 


TTT 


CCT 


ACC 


TCG 


AAA 


AGA 


ACC 


38 


S 


T 


N 


S 


V 


F 


P 


T 


S 


K 


R 


T 


140161 


GTG 


GAA 


ATC 


AAT 


AAT 


GAT 


CTC 


GGT 


AAT 


CAG 


CTA 


ACG 


50 


V 


E 


I 


N 


N 


D 


L 


G 


N 


Q 


L 


T 


140125 


TTA 


CTG 


TAT 


CAT 


TGT 


AAA 


TCA 


AAA 


GAC 


GAT 


GAT 


TTA 
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L 


140089 


GGT 
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CGG 


ACT 
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CAA 


CCA 


GGT 


GAG 
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TGG 


TCT 
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S 


140053 


TTT 


AGT 


TTC 


GGG 


CGT 


CAA 


TTC 


TTT 


GGA 


AGG 


ACG 


TTG 


86 


F 


S 


F 


G 


R 


Q 


F 


F 


G 


R 


T 


L 


140017 


TAT 


TTT 


TGT 


AGT 


TTT 


AGT 


TGG 


CCA 


AAT 


GAA 


TCG 


CAT 


98 


Y 


F 


C 


S 


F 


S 


W 


P 


N 


E 


S 


H 


139981 


TCG 


TTC 


GAT 


ATA 


TAT 


AAA 


GAC 


CAT 


CGA 


GAT 


AGC 


GGC 


110 


S 


F 


D 


I 


Y 


K 


D 


H 


R 


D 


S 


G 


139945 


GGT 


GAT 


AAC 


AAG 


TGC 


GAG 


AGC 


GAC 


AGG 


TGT 


GTG 


TGG 


122 


G 


D 


N 


K 


C 


E 


S 


D 


R 


C 


V 


W 


139909 


AAG 


ATA 


AGA 


AGA 


AAC 


GGA 


CCT 


TGT 


AGG 


TTT 


AAC 


GAT 


134 


K 


I 


R 


R 


N 


G 


P 


C 


R 


F 


N 


D 


139873 


GAA 


ACG 


AAG 


CAG 


TTT 


GAT 


CTT 


TGT 


TAT 


CCT 


TGG 


AAT 


146 


E 


T 


K 


Q 


F 


D 


L 


C 


Y 


P 


W 


N 


139837 


AAA 


TCT 


TTG 


TAT 


TGA 


CAACAATATGCTGATGTTCTGTCTTTTAC 


158 


K 


S 


L 


Y 


• 

















13 9793 GACTCATGGAGTTTCATTGTTTGAAACAATAATATAAAACATATAAAATT 

13 9743 TCTATTATTCCAAGTTCCAACTTATAATAATTTGATAATCATATCATATT 

139693 ATCATCTTAAGCATTCAATGCTACAAAGATAATACCCCCAAGCTATTTTA 

139643 CATTAAAAGCTGAAACAGAGACACAATACTAACGATAAAAGTTCGTAGTA 

139593 TCTTTATGCAACCATACATACATATACACAAAGATAGACAGGTAGTGTCC 

139543 TAATAATTCTACTTGGGTGAGGTATGAACAGCAGCAACAGTAGATACCAT 

13 9493 TGTATCCATACCACACATATTATGAGGCCCTCTGCAGATTTTGTAGTAAC 

13 9443 CATGCTCTCCCCACATCGCTCCCCACGAGTTCTTGATAATCCAA 



SEQ ID NO:9 Arabidopsis C541 amino acid sequence 

M 

140305 GAT ATT CCA AAG CAA TAT CTA TCA CTA TTC ATA TTG 

2DIPKQYLSLFIL 
140269 ATT ATC TTC ATA ACT ACA AAA TTA TCA CAA GCC GAC 

14IIFITTKLSQAD 
14 0233 CAT AAA AAC GAC ATT CCA GTT CCC AAC GAT CCA TCA 

26HKNDIPVPNDPS 
140197 TCA ACA AAT TCT GTG TTT CCT ACC TCG AAA AGA ACC 

38STNSVFPTSKRT 
140161 GTG GAA ATC AAT AAT GAT CTC GGT AAT CAG CTA ACG 

50VEINNDLGNQLT 
1-4-0125 — TTA _ CTG~ TAT~CAT ~TGT~AAA — TCA - AAA - GAC "~GAT~ GAT~TTA 

62LLYHCKSKDDDL 
14 0089 GGT AAC CGG ACT CTG CAA CCA GGT GAG TCG TGG TCT 

74GNRTLQPGESWS 
140053 TTT AGT TTC GGG CGT CAA TTC TTT GGA AGG ACG TTG 

86FSFGRQFFGRTL 
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5 



140017 


TAT 


TTT 


TGT 


AGT 


TTT 


AGT 


TGG 


CCA 


AAT 


GAA 


TCG 


CAT 


98 


Y 


F 


C 


S 


F 


S 


W 


P 


N 


E 


S 


H 


139981 


TCG 


TTC 


GAT 


ATA 


TAT 


AAA 


GAC 


CAT 


CGA 


GAT 


AGC 


GGC 


110 


S 


F 


D 


I 


Y 


K 


D 


H 


R 


D 


S 


G 


139945 


GGT 


GAT 


AAC 


AAG 


TGC 


GAG 


AGC 


GAC 


AGG 


TGT 


GTG 


TGG 


122 


G 


D 


N 


K 


C 


E 


S 


D 


R 


C 


V 


W 


139909 


AAG 


ATA 


AGA 


AGA 


AAC 


GGA 


CCT 


TGT 


AGG 


TTT 


AAC 


GAT 


134 


K 


I 


R 


R 


N 


G 


P 


C 


R 


F 


N 


D 


139873 


GAA 


ACG 


AAG 


CAG 


TTT 


GAT 


CTT 


TGT 


TAT 


CCT 


TGG 


AAT 


146 


E 


T 


K 


Q 


F 


D 


L 


C 


Y 


P 


W 


N 


139837 


AAA 


TCT 


TTG 


TAT 


TGA 


CAACAATATGCTGATGTTCTGTCTTTTAC 


158 


K 


S 


L 


Y 


• 

















SEQ ID NO: 10 promoter control element 
15 GAAAAGCGAA 

SEQ ID NO:l 1 promoter control element 
GAAAAGCCAA 
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